Los datasets proporcionados por el INTA EEA Concordia son los siguientes:
Las variables meteorológicas disponibles están medidas por hora por la estación automática del INTA Concordia.
Para los demás datasets el método de muestreo utilizado es el siguiente:
Cada lote se subdivide en 10 sublotes de similar tamaño. Luego se selecciona dentro de cada uno de los 10 sublotes, por sorteo, al azar, una planta. De ahà en adelante, se visitarán semanalmente cada una de esas 10 plantas seleccionadas. Una vez que las plantas están identificadas se subdivide imaginariamente su copa en 12 casquetes, según los cuatro puntos cardinales (Sur, Este, Norte y Oeste) y tres alturas (parte alta, media y baja de la planta). En cada casquete se selecciona al azar una ramita terminal de unos 30 - 40 cm de longitud y se la marca e identifica con una cinta de colores. De este modo en cada una de las 10 plantas seleccionadas quedan marcadas 12 ramitas (en total son 120 ramitas por lote).
Observaciones:
Para el dataset color-calibre solo se tienen en cuenta las orientaciones, no la altura.
| lote | fecha | id_planta | orientacion | color | calibre |
|---|---|---|---|---|---|
| 042-INTA-Salustiana | 21-APR-14 | 3 | 0 | 75% color naranja | 75 |
| D. Tito - V.Late | 28-mar-07 | 5 | 1 | 100% color verde intenso o 0% color naranja | 66 |
| D. Tito - Nova | 24-nov-15 | 8 | 0 | 100% color verde intenso o 0% color naranja | 14 |
| D. Tito - V.Late | 04-abr-07 | 4 | 2 | 100% color verde intenso o 0% color naranja | 68 |
| D. Tito - V.Late | 02-abr-12 | 9 | 3 | 100% color verde intenso o 0% color naranja | 59 |
## Classes 'data.table' and 'data.frame': 35960 obs. of 6 variables:
## $ lote : chr "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" ...
## $ fecha : chr "29-DEC-10" "29-DEC-10" "29-DEC-10" "29-DEC-10" ...
## $ id_planta : int 1 1 1 1 2 2 2 2 3 3 ...
## $ orientacion: int 0 1 2 3 0 1 2 3 0 1 ...
## $ color : chr "100% color verde intenso o 0% color naranja" "100% color verde intenso o 0% color naranja" "100% color verde intenso o 0% color naranja" "100% color verde intenso o 0% color naranja" ...
## $ calibre : chr "32" "42" "44" "43" ...
## - attr(*, ".internal.selfref")=<externalptr>
lote: indica el lote de cultivos sobre el cual se realizaron las mediciones/observaciones.
Se encuentran en formato caracter pero para un mejor análisis se convertirán a datos categóricos en la fase de limpieza de datos.
En la siguiente tabla podemos observar cuantas observaciones existen por cada uno de los lotes.
##
## 042-INTA-Salustiana 058-INTA-NovaR D. Tito - Nova
## 5160 5360 10360
## D. Tito - V.Late LOTE II NOVA
## 13960 1120
fecha: indica el dÃa de la observación. Las mismas se suelen realizar de manera semanal.
El formato de fechas se encuentran en tipo caracter lo cual se deberá transformar en datos de tipo Fecha para un mejor análisis. Se debe tener en cuenta para el formateo de las fechas que las mismas se encuentran en varios tipos de formato. Por ej. en la tabla inicial podemos observar meses en mayúsculas y minúsculas, asà como también en inglés y español (APR o abr para el mes de Abril).
id_planta: Identificación de la planta sobre la cual se realiza la observación. VarÃan de 1 al 10 y representa cada una de las plantas teniendo en cuenta el método de muestreo aplicado previamente.
##
## 1 2 3 4 5 6 7 8 9 10
## 3596 3596 3596 3596 3596 3596 3596 3596 3596 3596
orientación: Orientación de la rama sobre la cual se hace la observación. Los valores posibles son: 0, 1, 2, 3 y representan los puntos cardinales Sur, Este, Norte, Oeste respectivamente.
##
## 0 1 2 3
## 8990 8990 8990 8990
color: Color de la fruta teniendo en cuenta una escala de color predefinida según madurez. El color de la fruta se encuentra en formato caracter pero en la fase de limpieza de datos se lo transformará en tipo categórico y ordinal ya que existe un orden lógico entre los posibles valores.
##
## 100% color naranja
## 1736
## 100% color naranja intenso
## 2480
## 100% color verde intenso o 0% color naranja
## 24272
## 25% color naranja
## 4004
## 50% color naranja
## 1744
## 75% color naranja
## 1724
calibre: Diámetro ecuatorial de la fruta en milÃmetros.
El calibre de la fruta se encuentra en formato caracter lo cual se transformará en un dato numérico en la fase de limpieza de datos.
## Length Class Mode
## 35960 character character
| NOMBRE | FECHA | PLANTA | ALTURA | ORIENTACION | BROTACION | FLORACION |
|---|---|---|---|---|---|---|
| 042-INTA-Salustiana | 03-JAN-14 | 6 | 2 | 0 | B7 | F0 |
| D. Tito - Nova | 05-mar-14 | 10 | 0 | 0 | B6 | F7 |
| D. Tito - Nova | 29-oct-13 | 10 | 1 | 3 | B5 | F0 |
| D. Tito - Nova | 18-mar-14 | 4 | 2 | 1 | B6 | F0 |
| D. Tito - V.Late | 05-may-11 | 5 | 1 | 2 | B6 | F7 |
## Classes 'data.table' and 'data.frame': 165240 obs. of 7 variables:
## $ NOMBRE : chr "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" ...
## $ FECHA : chr "01-OCT-10" "01-OCT-10" "01-OCT-10" "01-OCT-10" ...
## $ PLANTA : int 1 1 1 1 1 1 1 1 1 1 ...
## $ ALTURA : int 0 0 0 0 1 1 1 1 2 2 ...
## $ ORIENTACION: int 0 1 2 3 0 1 2 3 0 1 ...
## $ BROTACION : chr "B3" "B3" "B3" "B3" ...
## $ FLORACION : chr "F2" "F2" "F2" "F2" ...
## - attr(*, ".internal.selfref")=<externalptr>
NOMBRE: indica el lote de cultivos sobre el cual se realizaron las mediciones/observaciones.
Se encuentran en formato caracter pero para un mejor análisis se convertirán a datos categóricos en la fase de limpieza de datos.
En la siguiente tabla podemos observar cuantas observaciones existen por cada uno de los lotes.
##
## 042-INTA-Salustiana 058-INTA-NovaR D. Tito - Nova
## 25200 25440 56160
## D. Tito - V.Late LOTE II NOVA
## 54360 4080
FECHA: indica el dÃa de la observación. Las mismas se suelen realizar de manera semanal.
El formato de fechas se encuentran en tipo caracter lo cual se deberá transformar en datos de tipo Fecha para un mejor análisis. Se debe tener en cuenta para el formateo de las fechas que las mismas se encuentran en varios tipos de formato. Por ej. en la tabla inicial podemos observar meses en mayúsculas y minúsculas, asà como también en inglés y español (APR o abr para el mes de Abril).
PLANTA: Identificación de la planta sobre la cual se realiza la observación. VarÃan de 1 al 10 y representa cada una de las plantas teniendo en cuenta el método de muestreo aplicado previamente.
##
## 1 2 3 4 5 6 7 8 9 10
## 16524 16524 16524 16524 16524 16524 16524 16524 16524 16524
ALTURA: Altura de la planta sobre la cual se realizó la observación. Los valores posibles son 0, 1 y 2 para las alturas parte Alta, Media y Baja respectivamente.
##
## 0 1 2
## 55080 55080 55080
ORIENTACIóN: Orientación de la rama sobre la cual se hace la observación. Los valores posibles son: 0, 1, 2, 3 y representan los puntos cardinales Sur, Este, Norte, Oeste respectivamente.
##
## 0 1 2 3
## 41310 41310 41310 41310
BROTACION: Representa el estadio fenológico de brotación de la planta teniendo en cuenta la orientación y la altura.
##
## B1 B2 B3 B34 B4 B5 B6 B7 B8
## 15405 6331 5212 3189 6434 14153 109960 3579 977
FLORACION: Representa el estadio fenológico de floración de la planta teniendo en cuenta la orientación y la altura.
##
## F0 F1.0 F1.1 F2 F3 F4 F5 F6 F7 F8
## 85212 8055 3450 3421 1030 1374 1923 3839 56526 410
| NOMBRE | FECHA | PLANTA | ESTADO |
|---|---|---|---|
| 042-INTA-Salustiana | 03-JAN-14 | 6 | R |
| D. Tito - Nova | 05-mar-14 | 9 | MB |
| D. Tito - Nova | 29-oct-13 | 9 | MB |
| D. Tito - Nova | 18-mar-14 | 3 | MB |
| D. Tito - V.Late | 05-may-11 | 2 | MB |
## Classes 'data.table' and 'data.frame': 13770 obs. of 4 variables:
## $ NOMBRE: chr "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" ...
## $ FECHA : chr "01-OCT-10" "01-OCT-10" "01-OCT-10" "01-OCT-10" ...
## $ PLANTA: int 1 2 3 4 5 6 7 8 9 10 ...
## $ ESTADO: chr "MB" "MB" "MB" "MB" ...
## - attr(*, ".internal.selfref")=<externalptr>
NOMBRE: indica el lote de cultivos sobre el cual se realizaron las mediciones/observaciones.
Se encuentran en formato caracter pero para un mejor análisis se convertirán a datos categóricos en la fase de limpieza de datos.
En la siguiente tabla podemos observar cuantas observaciones existen por cada uno de los lotes.
##
## 042-INTA-Salustiana 058-INTA-NovaR D. Tito - Nova
## 2100 2120 4680
## D. Tito - V.Late LOTE II NOVA
## 4530 340
FECHA: indica el dÃa de la observación. Las mismas se suelen realizar de manera semanal.
El formato de fechas se encuentran en tipo caracter lo cual se deberá transformar en datos de tipo Fecha para un mejor análisis. Se debe tener en cuenta para el formateo de las fechas que las mismas se encuentran en varios tipos de formato. Por ej. en la tabla inicial podemos observar meses en mayúsculas y minúsculas, asà como también en inglés y español (APR o abr para el mes de Abril).
PLANTA: Identificación de la planta sobre la cual se realiza la observación. VarÃan de 1 al 10 y representa cada una de las plantas teniendo en cuenta el método de muestreo aplicado previamente.
##
## 1 2 3 4 5 6 7 8 9 10
## 1377 1377 1377 1377 1377 1377 1377 1377 1377 1377
ESTADO: Indica el estado general de la planta al momento de la observación. Los estados posibles son Malo (M), Regular (R), Bueno (B) y Muy bueno (MB).
La siguiente tabla indica la cantidad de observaciones existentes en el dataset para cada estado posible. Más adelante se prevé otros análisis como por ejemplo diferenciar estos estados según el lote o analizar la evolución de los estados a través de distintos perÃodos del año.
##
## B M MB R
## 1963 93 11348 366
## Classes 'data.table' and 'data.frame': 888490 obs. of 4 variables:
## $ FECHA : chr "22-nov-06 22:00:00" "22-nov-06 22:00:00" "22-nov-06 22:00:00" "22-nov-06 22:00:00" ...
## $ VALOR : chr "0" "56,95" "0" "23,88" ...
## $ SIGNIFICADO: chr "Válido rango de sensor" "Válido rango de sensor" "Válido rango de sensor" "Válido rango de sensor" ...
## $ VARIABLE : chr "Velocidad Maxima Viento" "Humedad Media" "Velocidad Media Viento a 2m" "Temperatura Media" ...
## - attr(*, ".internal.selfref")=<externalptr>
FECHA: Indica el dÃa y la hora en donde se midió la variable meteorológica.
En la fase de limpieza de datos se debe convertir estos valores que por el momento son de tipo caracter a valores tipo timestamp de esta manera se pueden realizar varias operaciones como subdividir el dataset en perÃodos de tiempo, trabajar con meses, años, etc.
## Length Class Mode
## 888490 character character
VALOR: Indica la magnitud medida de la variable que se encuentra en la columna VARIABLE. Este dato deberá transformarse de tipo caracter a tipo numérico.
SIGNIFICADO: Indica la calidad de la medición.
En la fase de limpieza de datos no se tendrá en cuenta este atributo ya que es obligatorio realizar un análisis de datos faltantes y datos anómalos o también conocido como outliers.
##
## Anómalo o erróneo Dato bueno Dato faltante
## 782 284798 31313
## Dato sospechoso Incoherencia lógica Válido rango de sensor
## 2057 52 569488
VARIABLE: Indica la variable meteorológica que se esta midiendo.
##
## Humedad de la hoja Humedad Maxima
## 62391 79302
## Humedad Media Humedad Minima
## 79302 79302
## Precipitacion Radiacion Global Max W/m2
## 79310 33051
## Radiacion Global W/m2 Temperatura Máxima
## 79300 79302
## Temperatura Media Temperatura MÃnima
## 79302 79302
## Velocidad Maxima Viento Velocidad Media Viento a 2m
## 79313 79313
A simple vista podemos observar varios datos faltantes para Radiación global máxima y para Humedad de la hoja.
Magnitudes:
Fuente de la imagen. Además con el dataset estructurado como wide-format veremos claramente cuales son los atributos que tienen valores faltantes para un dÃa y una hora especÃfica. ***
| NOMBRE | FECHA | PLANTA | METODO | VALOR_ESTE | VALOR_OESTE | VALOR_NORTE | VALOR_SUR |
|---|---|---|---|---|---|---|---|
| 042-INTA-Salustiana | 12-11-13 | 4 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| D. Tito - Nova | 14-5-14 | 1 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| D. Tito - Nova | 6-1-14 | 3 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| D. Tito - Nova | 27-5-14 | 8 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| D. Tito - V.Late | 20-7-11 | 6 | Monitoreo de P.A. de Minador | 0 | 0 | 0 | 0 |
| D. Tito - Nova | 11-12-14 | 5 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| 042-INTA-Salustiana | 29-12-10 | 6 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| 058-INTA-NovaR | 24-8-12 | 10 | Monitoreo de P.A. de Minador | 0 | 0 | 0 | 0 |
| D. Tito - Nova | 11-12-15 | 10 | Monitoreo de P.A. de Diaphorina | 0 | 0 | 0 | 0 |
| D. Tito - Nova | 30-6-11 | 10 | Monitoreo de P.A. de Minador | 0 | 0 | 0 | 0 |
## Classes 'data.table' and 'data.frame': 25890 obs. of 8 variables:
## $ NOMBRE : chr "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" ...
## $ FECHA : chr "1-10-10" "1-10-10" "1-10-10" "1-10-10" ...
## $ PLANTA : int 1 2 3 4 5 6 7 8 9 10 ...
## $ METODO : chr "Monitoreo de P.A. de Diaphorina" "Monitoreo de P.A. de Diaphorina" "Monitoreo de P.A. de Diaphorina" "Monitoreo de P.A. de Diaphorina" ...
## $ VALOR_ESTE : int 0 0 0 0 0 0 0 0 0 0 ...
## $ VALOR_OESTE: int 0 0 0 0 0 0 0 0 0 0 ...
## $ VALOR_NORTE: int 0 0 0 0 0 0 0 0 0 0 ...
## $ VALOR_SUR : int 0 0 0 0 0 0 0 0 0 0 ...
## - attr(*, ".internal.selfref")=<externalptr>
NOMBRE: indica el lote de cultivos sobre el cual se realizaron las mediciones/observaciones.
Se encuentran en formato caracter pero para un mejor análisis se convertirán a datos categóricos en la fase de limpieza de datos.
En la siguiente tabla podemos observar cuantas observaciones existen por cada uno de los lotes.
##
## 042-INTA-Salustiana 058-INTA-NovaR D. Tito - Nova
## 4120 4220 8910
## D. Tito - V.Late
## 8640
FECHA: indica el dÃa de la observación. Las mismas se suelen realizar de manera semanal.
El formato de fechas se encuentran en tipo caracter lo cual se deberá transformar en datos de tipo Fecha para un mejor análisis. Se debe tener en cuenta para el formateo de las fechas que las mismas se encuentran en varios tipos de formato. Por ej. en la tabla inicial podemos observar meses en mayúsculas y minúsculas, asà como también en inglés y español (APR o abr para el mes de Abril).
PLANTA: Identificación de la planta sobre la cual se realiza la observación. VarÃan de 1 al 10 y representa cada una de las plantas teniendo en cuenta el método de muestreo aplicado previamente.
##
## 1 2 3 4 5 6 7 8 9 10
## 2589 2589 2589 2589 2589 2589 2589 2589 2589 2589
METODO: Indica el método de monitoreo de plaga sobre la planta. Este puede ser monitoreo de Minador o monitoreo de Diaphorina. En la fase de limpieza de datos este dataset se dividirá en dos datasets diferentes uno para Minador y otro para Diaphorina de esta manera se podrá analizar la evolución de las mismas de manera independiente.
En la siguiente tabla se indica la cantidad de observaciones para cada método.
##
## Monitoreo de P.A. de Diaphorina Monitoreo de P.A. de Minador
## 12530 13360
VALOR_ESTE, VALOR_OESTE, VALOR_NORTE, VALOR_SUR: Indican las distintas orientaciones sobre las cuales se realizaron los monitoreos y se cargan un código de presencia/ausencia de plaga.
Códigos de presencia/ausencia de plagas:
## Classes 'data.table' and 'data.frame': 2339 obs. of 8 variables:
## $ LOTE : chr "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" "042-INTA-Salustiana" ...
## $ FECHA : chr "11-JAN-11" "25-JAN-11" "01-feb-11" "09-feb-11" ...
## $ UBICACION_TRAMPA: chr "-31.36885278; -58.11273056" "-31.36885278; -58.11273056" "-31.36885278; -58.11273056" "-31.36885278; -58.11273056" ...
## $ TIPO_TRAMPA : chr "McPhail" "McPhail" "McPhail" "McPhail" ...
## $ METODO : chr "Monitoreo en Trampas de la Mosca Americana" "Monitoreo en Trampas de la Mosca Americana" "Monitoreo en Trampas de la Mosca Americana" "Monitoreo en Trampas de la Mosca Americana" ...
## $ CANT_HEMBRAS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ CANT_MACHOS : int 0 0 0 0 0 0 0 0 0 0 ...
## $ MTD : chr "0" "0" "0" "0" ...
## - attr(*, ".internal.selfref")=<externalptr>
LOTE: indica el lote de cultivos sobre el cual se realizaron las mediciones/observaciones.
Se encuentran en formato caracter pero para un mejor análisis se convertirán a datos categóricos en la fase de limpieza de datos.
En la siguiente tabla podemos observar cuantas observaciones existen por cada uno de los lotes.
##
## 042-INTA-Salustiana 058-INTA-NovaR D. Tito - Nova
## 366 107 567
## D. Tito - V.Late
## 1299
FECHA: indica el dÃa de la observación. Las mismas se suelen realizar de manera semanal.
El formato de fechas se encuentran en tipo caracter lo cual se deberá transformar en datos de tipo Fecha para un mejor análisis. Se debe tener en cuenta para el formateo de las fechas que las mismas se encuentran en varios tipos de formato. Por ej. en la tabla inicial podemos observar meses en mayúsculas y minúsculas, asà como también en inglés y español (APR o abr para el mes de Abril).
UBICACION_TRAMPA: Coordenadas en formato latitud/longitud de la ubicación geográfica de la trampa.
TIPO_TRAMPA: Indica si la observación se realizó sobre una trampa Jackson o McPhail.
##
## Jackson McPhail
## 1299 1040
En el FruTIC hay dos tipos de trampas, la trampa Jackson y la trampa McPhail. La trampa Jackson es una trampa seca y que consiste en una estructura de cartón laminado de color blanco con forma triangular. Dentro de la misma se coloca una lamina untada con un pegante y en la parte superior se cuelga una pastilla de Trimedlure que es una hormona de atracción sexual exclusiva para machos de la mosca del Mediterráneo (Ceratitis capitata). Cada vez que se hace la recorrida de los mosqueros, al revisar la trampa y hacer el recuento, se controla si el piso todavÃa sirve, si no está muy sucio o si el pegamento perdió sus propiedades y también si el Trimedlure no ha perdido fuerza. En general, tanto el piso como el atrayente pueden durar cuatro semanas. En ese piso quedan pegados, además de los machos de Ceratitis, otros insectos y moscas, partÃculas de tierra, ramitas. Por eso requiere un cambio periódico. Los machos de Ceratitis se distinguen con facilidad de otras moscas e insectos que pueden haber quedado pegados, pero quien recorre las trampas debe tener cierta capacitación para no cometer errores. La trampa McPhail es un recipiente plástico, donde se coloca agua y pastillas de un complejo proteico elaborado con levaduras. Se colocan cuatro pastillas por trampa y éstas se disuelven en el agua. Las proteÃnas y aminoácidos que se van liberando son un poderoso atrayente de todo tipo de moscas y también de otros insectos y atrae tanto a machos como a hembras, ya que no es un atractivo sexual sino que es un alimento muy deseado por estos insectos. La frecuencia del trampeo también es similar al de las Jackson. La diferencia es que en éstas se pueden encontrar tanto machos como hembras de Ceratitis capitata asà como también, tanto machos como hembras de Anastrepha fraterculus (mosca americana de los frutos). Esta última es una mosca de los frutos menos común que la del Mediterráneo pero igualmente también importante. Quien revisa las trampas debe estar capacitado para saber distinguir machos y hembras de ambas moscas de los frutos, más aún considerando que suele haber muchas otras moscas e insectos presentes en la trampa. En el caso de las Jackson los insectos quedan pegados en el piso de la trampa cuando se acercan a la misma. En el caso de la McPhail quedan flotando o sumergidos en la suspensión de las proteÃnas en el agua.
METODO: Indica si es un monitoreo de Mosca Americana o Mosca del Mediterráneo.
##
## Monitoreo en Trampas de la Mosca Americana
## 520
## Monitoreo en Trampas de la Mosca del Mediterráneo
## 1819
CANT_HEMBRAS: Indica la cantidad de moscas hembras encontradas en la trampa.
CANT_MACHOS: Indica la cantidad de moscas machos encontrados en la trampa.
MTD: El MTD (moscas por trampa y por dÃa) se obtiene, contando el número de moscas de la fruta presentes en el mosquero (se llama asà a la trampa para moscas que se colocan en los lotes cÃtricos) y dividiendo ese número por el número de dÃas entre esa fecha y la fecha en que se revisa previamente esa misma trampa.
Observación: Es común que las trampas se revisen una vez por semana. Por consiguiente al número de moscas que se encuentran en la trampa se lo divide por 7 y asà se obtiene el valor del MTD. Se considera como criterio para decidir realizar una aplicación de control un umbral para el MTD correspondiente a 0,14. Ello equivale a encontrar una mosca en el trampeo semanal. Con ese número basta para justificar realizar una aplicación.